Nicolae Sfetcu 


Etica Big Data 
in cercetare 


Colectia ESEURI 


MultiMedia Publishing 


Etica Big Data în cercetare 


Nicolae Sfetcu 


06.07.2019 


Sfetcu, Nicolae, "Etica Big Data în cercetare", SetThings (6 iulie 2019), DOI: 
10.13140/RG.2.2.27629.33761, MultiMedia Publishing (ed.), ISBN: 978-606-033-228-2, 
URL = https://www.telework.ro/ro/e-books/etica-big-data-in-cercetare 





Email: nicolae(Osfetcu.com 


(2) (=) Acest articol este licenţiat Creative Commons Attribution-NoDerivatives 4.0 
International. Pentru a vedea o copie a acestei licenţe, vizitaţi 
BY  ND http://creativecommons.org/licenses/by-nd/4.0/. 








Nicolae Sfetcu: Etica Big Data în cercetare 


Abstract 

Principalele probleme cu care se confruntă oamenii de ştiinţă în lucrul cu seturile 
mari de date (Big Data), evidențiind principale aspecte etice, luând în considerare inclusiv 
legislaţia din Uniunea Europeană. După o scurtă Introducere despre Big, Data, secţiunea 
Tehnologia prezintă aplicaţiile specifice în cercetare. Urmează o abordare a principalelor 
probleme filosofice specifice în Aspecte filosofice, şi Aspecte legale cu evidenţierea 
problemelor etice specifice din Regulamentul UE privind protecţia datelor 2016/679 
(General Data Protection Regulation, "GDPR"). Secţiunea Probleme etice detaliază 
aspectele specifice generate de Big Data. După o scurtă secţiune Cercetarea Big Data, 


finalizez lucrarea cu prezentarea Concluziilor pentru etica cercetării în lucrul cu Big Data. 
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1. Introducere 

Termenul Big Data se referă la extragerea, manipularea şi analiza unor seturi de 
date care sunt prea mari pentru a fi tratate în mod obişnuit. Din această cauză se utilizează 
software special şi, în multe cazuri, şi calculatoare şi echipamente hardware special 
dedicate. În general la aceste date analiza se face statistic. Pe baza analizei datelor 
respective se fac de obicei predicții ale unor grupuri de persoane sau alte entităţi, pe baza 
comportamentului acestora în diverse situaţii şi folosind tehnici analitice avansate. Se pot 
identifica astfel tendinţe, necesităţi şi evoluţii comportamentale ale acestor entităţi. 
Oamenii de ştiinţă folosesc aceste date pentru cercetări în meteorologie, genomică, 
(Nature 2008) conectomică, simulări fizice complexe, biologie, protecţia mediului , etc. 
(Reichman, Jones, and Schildhauer 2011) 

Odată cu creşterea volumului de date pe Internet, în media socială, cloud 
computing, dispozitive mobile şi date guvernamentale, Big Data devine în același timp o 
ameninţare şi o oportunitate pentru cercetători în ceea ce priveşte gestionarea şi utilizarea 


acestor date, menţinând în acelaşi timp drepturile persoanelor implicate. 


1.1 Definiţii 
Big Data includ, de obicei, seturi de date cu dimensiuni care depăşesc capacitatea 
software şi hardware obişnuite, folosind date nestructurate, semi-structurate şi 
structurate, cu accentul pe datele nestructurate. (Dedic and Stanier 2017) Dimensiunile 
Big Data au crescut în timp din 2012, de la câteva zeci de terabyte până la multe exabyte 
de date. (Everts 2016) Eficientizarea lucrului cu Big Data implică învăţarea maşinilor 
pentru a detecta modele, (Mayer-Schânberger and Cukier 2014) dar adesea aceste date 


sunt un produs secundar al altor activităţi digitale. 
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O definiţie din 2018 afirmă că "Big Data sunt datele care necesită instrumentele 
de calcul paralel pentru a gestiona datele", aceasta reprezentând o turnură în informatică, 
prin utilizarea teoriilor de programare paralelă şi lipsa unor garanţii presupuse de 
modelele anterioare." Big Data utilizează statistici inductive şi concepte de identificare a 
sistemelor neliniare pentru a deduce legi (regresii, relaţii neliniare şi efecte cauzale) din 
seturi mari de date cu densitate scăzută de informaţii pentru a obţine relaţii şi dependențe 
sau pentru a efectua predicții ale rezultatelor şi comportamentelor. 

La nivelul Uniunii Europene nu există o definiţie obligatorie dar, în conformitate 
cu Avizul 3/2013 al Grupului european de lucru privind protecţia datelor, 

"Big Data este un termen care se referă la creşterea enormă a accesului şi a utilizării 
automate a informaţiilor: se referă la cantităţile uriaşe de date digitale controlate 
de companii, autorităţi şi alte organizaţii mari, care sunt supuse unor analize 
ample bazate pe utilizarea de algoritmi. Big Data pot fi folosite pentru a identifica 
tendinţele şi corelaţiile generale, dar pot fi utilizate şi pentru a afecta direct 
persoanele." (European Economic and Social Committee 2017) 

Problema cu această definiţie e că nu ia în considerare reutilizarea datelor cu 
caracter personal. 

Regulamentul nr. 2016/679 defineşte datele personale (articolul 4, paragraful 
1) drept 
"orice informaţie referitoare la o persoană fizică identificată sau identificabilă (persoana 

vizată); o persoană fizică identificabilă este cea care poate fi identificată, în mod 
direct sau indirect, în special prin referire la un identificator cum ar fi un nume, un 
număr de identificare, date de localizare, un identificator online sau unul sau mai 
mulţi factori specifici identităţii fizice, fiziologice, genetice, mentale, economice, 
culturale sau sociale a acelei persoane fizice.” 

Definiţia se aplică, la nivelul UE, şi persoanelor neidentificate dar care pot fi 
identificate prin corelarea datelor anonime cu alte informaţii suplimentare. Datele cu 


caracter personal, o dată anonimizate (sau pseudo-anonimizate), pot fi prelucrate fără a 


fi nevoie de o autorizaţie, ţinându-se totuşi cont de riscul re-identificării persoanei vizate. 
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1.2 Dimensiunile Big Data 

Datele sunt partajate şi stocate pe servere, prin interacţiunea dintre entitatea 
implicată şi sistemul de stocare. În acest context, Big Data se poate clasifica în sisteme 
active (interacţiune sincronă, datele entității sunt trimise direct către sistemul de stocare), 
şi sisteme pasive (interacţiune asincronă, datele sunt colectate printr-un intermediar și 
apoi introduse în sistem. 

De asemenea, datele pot fi transmise direct în mod conştient, sau ne-conştient 
(dacă persoana ale cărei date sunt transmise nu este notificată la timp şi clar). Datele sunt 
apoi prelucrate pentru a genera statistici. 

În funcţie de ţinta analizelor statisticilor respective, dimensiunile datelor pot fi a) 
individuale (este analizat o singur entitate); sociale (se analizează grupuri discrete de 
entităţi din cadrul unei populaţii; şi hibride (când o entitate este analizată prin prisma 
apartenenţei sale la un grup deja definit). 

Producţia actuală imensă de date generate de utilizatori este estimată că va creşte 
cu 2000% 1 2 3 la nivel mondial până în 2020, şi sunt adesea nestructurate. (37) În 
general, Big Data se caracterizează prin: 

e Volum (cantitatea de date); 

e  Varietate (produse de diferite surse în diferite formate); 
e Viteză (viteza de analiza online a datelor); 

e  Veracitate (datele sunt incerte şi trebuie verificate); 

e Valoare (evaluată prin analiză). 

Volumul de date produse şi stocate evoluează în prezent exponențial, peste 90% 
din ele fiind generate în ultimii patru ani. (European Economic and Social Committee 


2017) Volumele mari necesită viteză mare de analiză, cu impact puternic asupra 
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veracităţii. Datele incorecte au potenţialul de a genera probleme atunci când sunt folosite 
în procesul de decizie. 

Una din probleme important cu Big Data este dacă este nevoie de datele complete 
pentru a trage anumite concluzii cu privire la proprietăţile lor, sau este suficient un 
eșantion. Big Data conţine chiar în nume un termen legat de dimensiune, care este o 
caracteristică importantă a Big Data. Dar eşantionarea (statistică) permite selectarea 
unor puncte corecte de colectare de date dintr-un set mai larg pentru a estima 
caracteristicile întregii populaţii. Big Data pot fi eşantionate pe diferite categorii de date 
în procesul de selecţie a probelor cu ajutorul unor algoritmii de eşantionare pentru Big 


Data. 


2. Tehnologia 

Datele trebuie procesate cu instrumente avansate de colectare şi analiză, pe baza 
unor algoritmi prestabiliţi, pentru a putea obţine informaţii relevante. Algoritmii trebuie 
să ia în considerare şi aspecte invizibile pentru percepțiile directe. 

În 2004 Google a publicat o lucrare despre un proces numit MapReduce care oferă 
un model de procesare paralelă. (Dean and Ghemawat 2004) De asemenea, MIKE2.0 este 
o aplicaţie în sursă deschisă pentru managementului informaţiilor. (MIKE2.0 2019) Mai 
multe studii din 2012 au arătat că arhitectura optimă pentru a aborda problemele din Big 
Data sunt cele cu mai multe straturi. O arhitectură paralelă distribuită distribuie date pe 
mai multe servere (medii de execuţie paralelă) putându-se îmbunătăţi astfel dramatic 
vitezele de procesare a datelor. 

Conform unui raport al Institutului Global McKinsey din 2011, principalele 


componente și ecosisteme ale Big Data sunt: (Manyika et al. 2011) tehnici de analiză a 
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datelor (învăţarea maşinilor, prelucrarea limbajului natural, etc.), tehnologii de mari 
dimensiuni (business intelligence, cloud computing, baze de date), şi vizualizări 
(diagrame, grafice, alte afişări ale datelor). 

Big Data furnizează informaţii în timp real sau aproape real, evitându-se astfel 


latenţa ori de câte ori este posibil. 


2.1 Aplicaţii 

Big Data în procesele guvernamentale cresc eficienţa costurilor, productivitatea şi 
inovaţia. Registrele civile sunt o sursă pentru Big, Data. Datele prelucrate ajută în domenii 
critice de dezvoltare, cum ar fi îngrijirea sănătăţii, ocuparea forţei de muncă, 
productivitatea economică, criminalitatea, securitatea şi gestionarea dezastrelor naturale 
şi a resurselor. (Kvochko 2012) 

De asemenea, Big Data oferă o infrastructură care este permite evidenţierea 
incertitudinilor, a performanţei, şi disponibilitatea componentelor. Tendinţele şi 
predicțiile în industrie necesită o cantitate mare de date și instrumente avansate de 
predicţie. 

Big Data contribuie la îmbunătăţirea asistenţei medicale prin furnizarea de 
medicamente personalizate şi analize prescriptive, intervenţii clinice cu evaluarea 
riscurilor și analize predictive, etc. Nivelul datelor generate în sistemele de sănătate este 
foarte mare. Dar există o problemă presantă cu generare de "date murdare", care cresc 
odată cu creşterea volumului de date, mai ales că cele mai multe sunt nestructurate şi greu 
de utilizat. Utilizarea Big Data în domeniul asistenţei medicale a generat provocări etice 
semnificative, cu implicaţii asupra drepturilor individuale, viaţa privată şi autonomia, 


transparenţa şi încrederea. 
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În media şi publicitate, pentru Big Data se folosesc numeroase puncte de informare 
despre milioane de persoane, pentru a servi sau transmite mesaje sau conţinuturi 
personalizate. 

În domeniul asigurărilor de sănătate se colectează date despre "factorii 
determinanţi ai sănătăţii”, care ajută la elaborarea de previziuni privind costurile de 
sănătate şi identificarea problemele de sănătate ale clienţilor. Această utilizare este 
controversată, datorită discriminării clienţilor cu probleme de sănătate. (Allen 2018) 

Big Data şi tehnologia informaţiei se complementează reciproc, ajutând împreună 
la dezvoltarea Internetului Lucrurilor (Internet of Things, IoT) pentru interconectarea 
dispozitivelor inteligente şi colectarea datelor senzoriale utilizate în diferite domenii. 

În sport, Big Data poate ajuta la îmbunătăţi pregătirii şi înţelegerea concurenţilor 
utilizând senzori specifici, şi se poate prezice performanţa viitoare a sportivilor. Senzorii 
ataşaţi maşinilor din Formula 1 colectează, printre altele, date din presiunea în anvelope 


pentru a eficientiza arderea combustibilului. 


2.1.1 În cercetare 

În ştiinţă, sistemele Big Data sunt folosite intens în acceleratoarele de particule de 
la CERN (150 de milioane de senzori transmit date de 40 de milioane de ori pe secundă, 
pentru cca 600 de milioane de coliziuni pe secundă, din care se utilizează după filtrare 
doar 0,001% din totalul datelor obţinute), (Brumfiel 2011) în telescoapele radio astrofizice 
construite din mii de antene, decodificarea genomului uman (iniţial a durat câţiva ani, cu 
Big Data se poate realiza în mai puţin de o zi), studii climatice, etc. 

Marile firme IT utilizează depozite de date de ordinul zecilor de petabyte pentru 


căutare, recomandări şi merchandising. Cele mai multe date sunt colectate de Facebook, 
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cu peste 2 miliarde de utilizatori activi lunar, (Constine 2017) şi Google cu peste 100 de 
miliarde de căutări pe lună. (Sullivan 2015) 

În cercetare se foloseşte mult căutarea criptată şi formarea clusterelor în Big Data. 
Ţările dezvoltate investesc enorm în prezent pentru cercetare în Big Data. În cadrul 
Uniunii Europene, aceste cercetări sunt înglobate în programul-cadrul Orizont 2020. 
(European Commission 2019) 

Adesea, programele de cercetare folosesc resursele API de la Google şi Twitter 
pentru a obţine acces la sistemele lor Big Data, gratuit sau contra cost. 

Seturile mari de date vin cu provocări algoritmice care anterior nu existau, fiind 
imperios necesar să se schimbe în mod fundamental modalităţile de procesare. Pentru 
aceasta s-au creat ateliere speciale de lucru care reunesc oameni de știință, statisticieni, 


matematicieni şi practicieni pentru a discuta despre provocările algoritmice ale Big Data. 


3. Aspecte filosofice 

Big Data poate genera, prin inferenţe, noi cunoaşteri şi perspective. Paradigma 
care rezultă din utilizarea Big Data generează noi oportunităţi. 

Un motiv de îngrijorare majoră în cazul Big Data se datorează faptului că oamenii 
de ştiinţă de date tind să lucreze cu date despre subiectele pe care nu le cunosc şi cu care 
nu au fost niciodată în contact, fiind înstrăinaţi de produsul final al activităţii lor 
(aplicarea analizelor). Un studiu recent (Tanner 2014) afirmă că ceasta poate fi motivul 
unui fenomen cunoscut ca alienarea digitală. 

Big Data are influenţe mari la nivel guvernamental, afectând pozitiv societatea. 
Aceste sisteme pot fi eficientizate prin aplicarea politicilor de transparenţă şi de guvernare 


deschisă, precum Open Data. 
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După elaborarea modelelor predictive privind comportamentul audienței ţintă, Big 
Data pot fi utilizate pentru a genera avertizări timpurii pentru diverse situaţii. Există 
astfel un feedback pozitiv între cercetare şi practică, cu descoperiri rapid preluate de 
practică. 

A. Richterich afirmă că popularizarea monitorizării activităţii utilizatorilor a fost 
motivată de pretenţiile că utilizarea (şi colectarea de date cu) aceste dispozitive ar 
îmbunătăţi bunăstarea, sănătatea şi speranţa de viaţă a utilizatorilor, şi ar reduce 
semnificativ costurile asistenţei medicale. (Richterich, 2018) Pentru a obţine 
consimţământul utilizatorilor, multe firme au oferit reduceri acelor clienţi care ar fi 
dispuşi să furnizeze acces la datele lor de monitorizare. (Mearian 2015) Dar există şi 
îngrijorări cu privire la influenţa acestor tehnologii asupra societăţii în special în 
probleme legate de corectitudine, discriminare, intimitate, abuz de date şi siguranţă. 
(Collins 2016) 

Conceptual, Big Data ar trebui înţelese ca un termen umbrelă pentru un set de 
tehnologii emergente. În utilizarea lor, trebuie să ţinem seama de contextele, reţelele, 
infrastructurile şi interdependenţele culturale, sociale şi tehnologice care pot avea sens 
asupra Big Data. Termenul de "Big Data" nu se referă doar la datele ca atare, ci şi la 
practicile, infrastructurile, reţelele şi politicile care influenţează diversele lor manifestări. 
Înțelegerea datelor mari ca un set de tehnologii emergente pare a fi utilă din punct de 
vedere conceptual, deoarece cuprinde evoluţii digitale activate în colectarea, analiza şi 
utilizarea datelor.” (Richterich, 2018) 

În acest context, Rip descrie dilema evoluţiilor tehnologice: "Pentru tehnologiile 
emergente cu viitorul lor nedeterminat, există provocarea de a articula valori şi reguli 
corespunzătoare care vor purta greutate. Acest lucru se întâmplă prin articularea 
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promisiunilor şi viziunilor despre noile tehnologii [...] ” (Rip 2013, 192) Astfel, 
tehnologiile emergente sunt locuri de" normativitate omniprezentă "caracterizată prin 
articularea promisiunilor şi a temerilor, conceptualizând o astfel de "normativitate 
omniprezentă" ca o abordare "în spiritul eticii pragmatice, în care poziţiile normative co- 
evoluează." (Rip 2013, 205) 

Etica pragmatică subliniază faptul că noile tehnologii se dezvoltă în societăţile în 
care sunt discursiv asociate/disociate de anumite norme şi valori. În acelaşi timp, 
pragmatismul afirmă că creşterea numărului mare de date şi a practicilor legate de 
cercetare nu este o simplă chestiune a superiorității tehnologice. Ele formează un câmp 
de justificare normativă şi contestaţie. 

Neo-pragmaticii în abordarea eticii abordează cunoaşterea epistemologică prin 
prisma falsificabilităţii cunoştinţelor (ştiinţifice), cu evaluări critice ale structurilor 
puterii sociale. Keulartz et al. au propus o abordare pragmatică a eticii într-o cultură 
tehnologică (Keulartz et al. 2004) ”ca o alternativă care combină punctele forte ale eticii 
aplicate şi studiile ştiinţifice şi tehnologice, evitând în acelaşi timp deficienţele acestor 
domenii.” (Richterich, 2018) Astfel, etica aplicată este o abordare eficientă în ceea ce 
priveşte detectarea şi exprimarea normativelor implicate în (inter-)acţiunile socio- 
tehnice sau care rezultă din acţiuni socio-tehnice, dar nu are posibilităţi în a surprinde 
normativitatea inerentă şi agentul tehnologiilor. (Keulartz et al. 2004, 5) 

Keulartz et al. consideră că astfel se poate depăşi lipsa evaluărilor tehnologice 
normative: "impasul care a apărut din acest punct de vedere" (adică respectivele "pete 
oarbe" ale eticii aplicate) poate fi depăşit printr-o reevaluare a pragmatismului." (Keulartz 
et al. 2004, 14) Pragmatismul etic poate fi caracterizat prin trei principii şi principii 


comune: anti-fundaţionalism, anti-dualism şi anti-scepticism. 
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Anti-fundaţionalismul se referă la principiul falsificabilităţii, considerând că nu 
putem ajunge la certitudine în ceea ce priveşte cunoştinţele sau valorile ("adevăr final"), 
dar cunoaşterea, ca şi valorile şi normele, se schimbă în timp. Valorile morale nu sunt 
statice, ci pot fi renegociate în funcţie de evoluţiile tehnologice. 

Anti-dualismul implică necesitatea de a se abţine de la dihotomii predefinite. 
Printre dualismele criticate de Keulariz sunt esenţa/aparenţa, teoria/practica, 
conştiinţa /realitatea şi faptele/valoarea. Etica aplicată tinde să asume astfel de dualisme 
ca a priori, spre deosebire de pragmatism care subliniază interrelaţiile şi liniile neclare 
dintre astfel de categorii. 

Anti-scepticismul este strâns legat de nevoia de perspective situate şi normativitate 
explicită, având legătură cu fundaţia anti-carteziană a pragmatismului. 

În cercetarea europeană, pragmatismul a fost respins de obicei ca "superficial şi 
oportunist", fiind asociat cu "stereotipuri negative", (Joas 1993) fiind acuzat de 
"utilitarism şi meliorism." (Keulartz et al. 2004, 15) La sfârşitul anilor 1990 şi 2000, 
pragmatismul a cunoscut o revigorare în cercetarea europeană. (Baert and Turner 2004) 

Analiza Big Data din punct de vedere etic implică două aspecte principale 
interdependente: unul teoretic (descrierea filosofică a elementelor supuse controlului 
etic) şi o viziune pragmatică (a impactului asupra vieţii oamenilor şi organizaţiilor). 
(European Economic and Social Committee 2017) 

Există probleme etice provocate de inteligenţa artificială, şi o strânsă legătură între 
Big Data şi inteligenţa artificială şi derivatele acesteia: învăţarea automată, analiza 
semantică, exploatarea datelor. 

O abordare a eticii este prin agenţia morală cu cel puţin cele trei condiţii de 
cauzalitate, cunoaştere şi alegere. Conform lui Noorman: (Noorman 2012) 
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Există legături cauzale între persoane şi rezultatul acţiunilor. Responsabilitatea 
persoanei derivă din controlul asupra rezultatului. 

Subiectul trebuie să fie informat, inclusiv despre posibilele consecinţe. 

Subiectul trebuie să îşi dea consimţământul şi să acţioneze într-un anumit mod. 


Profesorul Floridi, în A patra revoluţie, identifică problema morală a Big, Data cu 


descoperirea unui model simplu: o nouă frontieră a inovării şi a concurenţei. (Floridi 


2014) O altă problemă asociată cu Big Data este riscul de a se descoperi aceste tipare, 


modificând astfel predicțiile. 


Regula de bază a eticii Big Data este protecţia vieţii private, libertatea şi puterea 


discreţionară de a decide în mod autonom. De remarcat că există o tensiune continuă 


între nevoile individuale şi cele ale unei comunităţi. 


Este posibil să se identifice mai multe probleme etice care derivă din exploatarea 


Big Data: (European Economic and Social Committee 2017) 


Confidenţialitatea - Limita extremă a confidenţialităţii este seclusia, definită de 
Alan F. Westin ca "retragerea voluntară a unei persoane din societatea generală 
prin mijloace fizice într-o stare de singurătate". Moor şi Tavani au definit un model 
de confidenţialitate numit Control acces restricţionat (RALC) care face diferenţa 
între confidenţialitate, justificare, şi managementul vieţii private. 

Realitatea adaptată şi baloane de filtru - Aplicația aflată pe un server colectează 
informaţii învățând din acestea, şi apoi foloseşte acele informaţii pentru a construi 
un model al intereselor noastre. Când un sistem utilizează aceste modele pentru a 
filtra informaţii, e posibil să fim induşi să credem că ceea ce vedem este o viziune 
completă a unui context specific, când de fapt noi suntem limitați de "înţelegerea" 


unui algoritm care a construit modelul. Efectele etice pot fi multiple: se pot 
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ascunde unele informaţii impunând prejudecăţi de care nu ştim, viziunea noastră 
asupra lumii poate deveni progresiv limitată, iar pe termen lung ar putea genera o 
favorizare a unui anumit punct de vedere. 

Gestionarea ulterioară a datelor după deces - Ce se întâmplă cu datele unui 
utilizator care a decedat? Moştenitorii devin proprietarii acestora? Se pot elimina 
datele din lumea digitală? Există aici probleme atât juridice cât şi tehnologice. 
Prejudecăţi de algoritm - Interpretarea datelor implică, aproape întotdeauna, 
anumite prejudecăţi. În plus, există posibilitatea ca o eroare într-un algoritm să 
introducă forme de părtinire. O problemă etică este încrederea noastră implicită 
în algoritmi, cu riscuri mari atunci când nu se iau în considerare riscurile datorită 
erorilor de programare sau rulare a algoritmilor. 

Confidenţțialitatea vs. creşterea puterii de analiză - Se referă la natura emergentă 
a informaţiilor ca la un sistem complex: rezultatul datelor provenite din contexte 
diferite este mai mult decât suma simplă a părților. 

Limitarea scopului - Este foarte greu sau chiar imposibil să se limiteze utilizarea 
datelor. Confidenţialitatea nu este un singur element bloc, existând forme subtile 
de pierdere a vieţii private. 

Inerţia profilului digital al utilizatorilor - Aceasta ţine de subiectul realităţii 
personalizate. Un model care implică interesele unui utilizator se bazează, de 
obicei, pe comportamentul trecut şi pe informaţiile din trecut. Astfel, algoritmii nu 
se bazează pe identitatea actuală a persoanei, ci pe o versiune anterioară. Astfel se 
va influenţa comportamentul real utilizatorului, fiind împinşi să îşi menţină 
interesele vechi şi deci să nu poată descoperi alte oportunităţi. Dacă utilizatorul nu 


este conştient de această problemă, influenţa inerţiei va fi mult mai mare. 
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Radicalizarea utilizatorilor, conformismul şi sectarismul - Big, Data poate forma 
opinii folosind algoritmi de filtrare/recomandare, informaţii, articole şi postări 
personalizate, şi recomandări specifice de prieteni. Astfel, utilizatorii vor fi din ce 
în ce mai mult în contact cu oamenii, opiniile şi faptele care vor susţine poziţia lor 
iniţială. Această tendinţă este, de multe ori, ascunsă utilizatorilor sistemelor bazate 
pe Big Data, existând tendinţa dezvoltării unor prejudecăţi, mergând de la 
conformism până la radicalizare. Se poate postula formarea unui fel de 
subconștient tehnologic cu impact asupra dezvoltării personalităţii utilizatorilor, 
fenomene evidente în cazul reţelelor sociale, unde distanţa dintre lumea reală 


PAL 


("fizică") şi Internet este puternic atenuată. 

Impact asupra capacităţilor personale şi a libertății 

Drepturi egale între proprietarul datelor şi exploatatorul de date - De obicei 
persoana ale cărei date sunt utilizate nu este proprietarul legal al acestora. De 


aceea, o cerință minimă este ca acea persoană să aibă acces la propriile date, 


permițându-i să le descarce şi eventual să le şteargă. 


4 Aspecte legale 


Utilizarea Big Data prezintă probleme juridice semnificative, în special din punctul 


de vedere al protecţiei datelor. Cadrul juridic existent al Uniunii Europene, bazat în 
special pe Directiva nr. 46/95/CE şi Regulamentul general privind protecţia datelor cu 
caracter personal, oferă o protecţie corespunzătoare. Dar, pentru Big Data este necesară 
o strategie cuprinzătoare şi globală. Evoluţia în timp a fost de la dreptul de a exclude pe 
alţii la dreptul la controlul propriilor date şi, în prezent, la regândirea dreptului la 


identitate (digitală). 
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Colectarea şi agregarea datelor în Big Data nu sunt supuse reglementărilor privind 
protecţia datelor, datorită noilor perspective privind confidenţialitatea, cu posibilitatea 
apariţiei unor forme specifice de discriminare. 

În 2014, în raportul Podesta s-a concluzionat că "analizele Big Data au potenţialul 
de a eclipsa protecţia drepturilor pe termen lung în ceea ce priveşte modul în care 
informaţiile personale sunt utilizate în locuinţe, pentru credite, ocuparea forţei de muncă, 
sănătate, educaţie." (European Economic and Social Committee 2017) Rezultă că sunt 
necesare noi modalităţi specifice de protecţie a cetăţenilor, deoarece cadrul juridic, chiar 


dacă este teoretic aplicabil, nu pare să ofere o protecţie adecvată şi deplină. 


4.1 GDPR 

Regulamentul UE privind protecţia datelor 2016/679 (General Data Protection 
Regulation, "GDPR") se ocupă de protecţia datelor şi viaţa privată a persoanelor din 
Uniunea Europeană şi Spaţiul Economic European. Abordează în mod special exportul 
de date cu caracter personal în afara zonelor UE şi SEE. GDPR intenţionează să simplifice 
mediul de reglementare prin unificarea reglementării în cadrul UE. (European 
Parliament 2016) 

GDPR se aplică în două cazuri pentru prelucrarea datelor cu caracter personal (a) 
accesare de bunuri sau servicii contra cost de persoane din UE, sau (b) monitorizarea 
comportamentului lor în cadrul UE. Astfel, regulamentul permite extinderea acestuia la 
toţi furnizorii de servicii pe internet, chiar dacă nu sunt stabiliţi în UE. Mai general, GDPR 
se aplică tuturor agregatorilor mari de date, indiferent de conexiunile geografice sau 


fizice. 
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Etapele procesării datelor personale 

Prelucrarea datelor cu caracter personal este definită de articolul 4, alineatul (2), 
ca fiind "orice operaţiune sau set de operaţiuni care se efectuează pe date cu caracter 
personal sau pe seturi de date cu caracter personal, cum ar fi colectarea, înregistrarea, 
organizarea, structurarea, stocarea, adaptarea sau modificarea, recuperarea, consultarea, 
utilizarea, dezvăluirea prin transmitere, difuzarea sau punerea la dispoziţie în alt mod, 
alinierea sau combinarea, restricționarea, ştergerea sau distrugerea acestor date”. 

Big Data include mai multe activităţi de prelucrare a datelor cu caracter personal, 
fiecare cu normele ei specifice: 


colectarea datelor 


sa 


stocarea datelor 


3 


3. agregarea datelor 


4. analiza datelor şi utilizarea rezultatelor analizei 


Principiile procesării datelor 
Prelucrarea datelor se bazează pe următoarele principii stabilite în Articolul 5 din 
GDPR: 

1. Legalitate, corectitudine şi transparenţă: Utilizatorii trebuie să fie pe deplin şi 
corect informaţi în ceea ce priveşte politica de confidenţialitate şi, să poată accesa 
uşor propriile date. 

2. Limitarea scopului: Colectorii de date trebuie să informeze persoana vizată despre 
scopurile colectării datelor, care pot fi prelucrate ulterior numai în acele scopuri. 

3. Minimizarea datelor: Vor fi colectate numai datele cu caracter personal relevante 


scopurilor declarate. 
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4. Precizia şi actualizarea: Datele se vor actualiza şi rectifica ori de câte ori se impune 
prin scopul declarat. În cazul Big Data, este foarte important dreptul utilizatorilor 
de anulare sau ştergere a datelor personale. 

5. Limitarea stocării: Datele vor fi păstrate doar pe perioada procesării şi ulterior vor 
fi distruse. Durata stocării poate fi prelungită în măsura în care datele sunt arhivate 
în scopuri de interes public, cercetare ştiinţifică sau istorică sau statistice. 

6. Integritatea şi confidenţialitatea: operatorul de date: Se va asigura o securitate 


adecvată datelor cu caracter personal prin măsuri tehnice şi organizatorice. 


Politica de confidenţialitate şi transparenţa 


În cazul colectării de date pentru a completa un formular, se va respecta principiul 
minimizării datelor, solicitându-se doar datele relevante şi strict necesare. In cazul 
colectării automate de date, precum cookie, monitorizare web sau geolocaţie, politica de 


confidenţialitate trebuie să informeze utilizatorul asupra acestui aspect. 


Scopurile procesării datelor 
Datele anonime şi agregate pot fi procesate în scopul identificării 
comportamentului anumitor categorii de consumatori. În acest scop, operatorul de date 


efectuează anonimizarea şi le transferă apoi unei terţe părţi care le utilizează. 


Confidenţialitate prin design şi implicită 

Conceptele de confidenţialitate prin design şi confidenţialitate implicită nu au fost 
incluse explicit în reglementările UE. Dar, în conformitate cu art. 78 din GDPR, "Pentru 
a putea demonstra conformitatea cu prezentul regulament, operatorul ar trebui să adopte 
politici interne şi să pună în aplicare măsuri care să îndeplinească, în special, principiile 


protecţiei datelor prin proiectare şi protecţia datelor în mod implicit. Astfel de măsuri ar 
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putea consta, între altele, în minimizarea prelucrării datelor cu caracter personal, 
pseudonimizarea datelor cu caracter personal cât mai curând posibil, transparenţa în ceea 
ce priveşte funcţiile şi prelucrarea datelor cu caracter personal, care să permită persoanei 
vizate să monitorizeze prelucrarea datelor, permiţând operatorului să creeze şi să 
îmbunătăţească caracteristicile de securitate. La elaborarea, proiectarea, selectarea şi 
utilizarea aplicaţiilor, serviciilor şi produselor care se bazează pe prelucrarea datelor cu 
caracter personal sau prelucrarea datelor cu caracter personal pentru a-şi îndeplini 
sarcinile, ofertanţii de produse, servicii și aplicaţii ar trebui încurajați să ia în considerare 
dreptul la date atunci când proiectează şi elaborează astfel de produse, servicii şi aplicaţii, 
ţinând cont de stadiul actual al tehnicii, pentru a se asigura că operatorii şi prelucrătorii 


îşi pot îndeplini obligaţiile de protecţie a datelor." 


Paradoxul (legal) al Big Data 

Utilizarea Big, Data implică cel puţin un paradox: pe de o parte, Big Data asigură o 
transparenţă maximă dar, în acelaşi timp, nu există o transparenţă adecvată în ceea ce 
priveşte utilizarea Big Data. Transparenţa este o problemă fundamentală deoarece 


influenţează capacitatea unui utilizator de a permite divulgarea informaţiilor sale. 


5. Probleme etice 


Etica Big Data presupune aderarea la conceptele de comportament corect şi greşit 
în ceea ce priveşte datele, în special datele cu caracter personal. Etica Big Data pune 
accentul pe colectorii şi diseminatorii de date structurate sau nestructurate. 

Etica Big Data este susţinută, la nivelul UE, de o amplă documentaţie, prin care se 
încearcă să se găsească soluţii concrete pentru maximizarea valorii Big Data fără a 


sacrifica drepturile fundamentale ale omului. Autoritatea Europeană pentru Protecţia 
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Datelor (AEPD) sprijină dreptul la viaţă privată şi dreptul la protecţia datelor cu caracter 

personal în respectul demnităţii umane. Conform acestor documente, trebuie să se 

depăşească conflictul conceptual dintre viaţa privată şi Big Data,şi între intimitate şi 
inovaţie. Este esenţial să se identifice modalităţile de includere a dimensiunii etice în 

conceperea inovaţiilor. (European Economic and Social Committee 2017) 

Conform noului Regulament al UE 2016/679, operatorii de date trebuie să pună în 
aplicare măsurile de  confidenţialitate şi tehnologiile de îmbunătăţire a 
confidenţialităţii în momentul determinării modalităţilor de procesare şi al procesării în 
sine. Prin ENISA75 au fost identificate multe strategii de confidenţialitate prin design 
(minimizarea datelor, ascunderea datelor cu caracter personal şi interconexiunile 
acestora, prelucrarea separată a datelor cu caracter personal, alegerea celui mai înalt nivel 
de agregare, transparenţa, monitorizarea, politica de confidenţialitate, aspecte legale). 

O modalitate de bază pentru coexistenţa paşnică dintre exploatarea Big Data şi 
protecţia datelor este controlul, de către utilizator, a datelor personale, ceea ce conduce 
la transparenţă şi încredere între utilizatori şi furnizorii de servicii digitale. După cum s- 
a subliniat în evaluarea impactului GDPR, 

"Construirea încrederii în mediul online este esenţială pentru dezvoltarea economică. 
Lipsa de încredere îi face pe consumatori să ezite să cumpere online şi să adopte 
noi servicii, inclusiv serviciile publice de e-guvernare. Dacă nu este abordată, 
această lipsă de încredere va continua să încetinească dezvoltarea utilizărilor 
inovatoare ale noilor tehnologii, să acţioneze ca un obstacol în calea creşterii 
economice şi să blocheze sectorul public în a profita de beneficiile potenţiale ale 
digitalizării serviciilor sale." 

În cazul Big Data modelele tradiţionale de consimţământ sunt insuficiente şi 
depăşite. "Consimţământul ar trebui să fie suficient de granular pentru a acoperi toate 
procesele diferite şi scopurile de prelucrare şi reutilizare a datelor cu caracter personal.” 


(European Economic and Social Committee 2017) 
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O problemă specială este portabilitatea datelor, susţinută la nivelul UE de AEPD 
în Avizul 7/2015, (MORO 2016) unde se impune garantarea dreptului cetăţenilor de a 
accesa şi corecta datele personale printr-un control extins. Portabilitatea datelor poate 
ajuta la creşterea gradului de conştientizare şi control al consumatorilor prin transferul 
între servicii online. 

AEPD consideră că datele cu caracter personal ar trebui să fie tratate la fel ca alte 
resurse importante, precum petrolul, unde tranzacţionarea are loc între părţi la fel de bine 
informate (simetria informaţională). În realitate, piaţa informaţiilor cu caracter personal 
are un caracter de asimetrie informaţională, nefiind nici transparentă, nici echitabilă, 
clienţii nefiind compensaţii pentru informaţiile personale pe care le oferă. Astfel, 
portabilitatea datelor ar încuraja un mediu mai competitiv între beneficiarii acestor date, 
utilizatorii având posibilitatea să aleagă cui oferă atele personale. 

O altă abordare pune în discuţie stocarea datelor cu caracter personal, cu 
posibilitatea pentru utilizator de a acorda sau retrage consimţământul pentru datele sale 
personale. (MORO 2016) (DG Connect 2015) Stocarea datelor cu caracter personal 
implică un "concept cadru şi o implementare arhitecturală care transferă achiziţia şi 
controlul datelor de la un model de date distribuit la un model orientat spre utilizator.” 
(European Economic and Social Committee 2017) Portabilitatea datelor ar putea asigura 
acest deziderat. 

AEPD susţine promovarea beneficiarilor responsabili şi reducerea birocraţiei în 
protecţia datelor, prin coduri de conduită, audituri, certificări, şi o nouă generaţie de 
clauze contractuale şi reguli corporative obligatorii. Responsabilitatea beneficiarilor Big 
Data presupune instituirea unor politici interne şi a unor sisteme de control conforme cu 
legislaţia în vigoare, prin soluţii inteligente şi dinamice care să garanteze respectarea 
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principiilor fundamentale (minimizarea datelor, limitarea scopului, calitatea datelor, 
procesarea corectă și transparentă a datelor, design, limitare de stocare, integritate şi 
confidenţialitate). 

Etica datelor se bazează pe următoarele principii: proprietatea (persoanele fizice 
deţin propriile date, transparenţa tranzacţiilor (utilizatorii trebuie să aibă acces 
transparent la proiectarea algoritmului), consimţământ (utilizatorul trebuie să fie 
informat şi să îşi exprime explicit consimţământul cu privire la utilizarea datelor 
personale, confidenţialitate (trebuie protejată confidenţialitatea utilizatorilor), 
financiar (utilizatorul să cunoască tranzacţiile financiare rezultate din utilizarea datelor 


lui personale), şi deschidere (seturile de date agregate să fie disponibile în mod liber). 


Etica în cercetare 
Termenul de studiu critic de date (SCD) implică faptul că cercetătorii investighează 
Big Data din perspective critice. Studierea datelor în acest context implică, pe lângă 
analiza lor, şi încorporarea datelor în practici (cunoaşterea), instituţii şi sisteme politice 
şi economice, prin interacţiunea complexă dintre date şi entităţile care le produc, deţin şi 
folosesc. 
Un raport al OECD (2013) subliniază că, spre deosebire de normele etice aplicate 
datelor obişnuite de cercetare, în cazul Big Data: (OECD 2013) 
e Colectarea de date nu a făcut obiectul unui proces formal de examinare etică. 
e Normele etice obişnuite nu vor fi implementate în cazul Big, Data 
e Utilizarea datelor pentru cercetare poate să difere de scopul iniţial. 


e Datele nu mai sunt deţinute ca seturi discrete. 
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Relaţia dintre cei care oferă datele şi cei care le folosesc este adesea indirectă şi 
variabilă. Un raport mai recent al OECD (2016) susţine că această relaţie este mai slabă 
sau inexistentă, Big Data limitând capabilitățile obişnuite. (OECD 2016) 

Stocarea datelor e importantă pentru integritatea cercetării. Datele trebuie să aibă 
o "provenienţă" clară, cu surse şi procesare cunoscute, identificate şi documentate. 

Multe date care nu sunt colectate special pentru cercetare au standarde diferite în 
cercetarea datelor. 

Pentru anumite date, adesea cu valoare comercială (de ex., datele colectate pe 
Twitter), există restricţii legale privind reproducerea lor. (UK Data Service 2017) 


Depozitele de date trebuie să respecte standardele de transparenţă și 


reproductibilitate. 


Conștientizarea 

Conştientizarea tipului de date care sunt furnizate în timpul unei înregistrări 
online (pentru crearea unui cont, sau un abonament, de ex.) este un fapt rar, mai ales că 
există posibilitatea folosirii unei identități digitale deja existente (profil Facebook, de ex.) 
în locul unei înregistrări separate, pentru un acces mai rapid. Astfel de situaţii creează o 


opacitate cu privire la datele partajate între furnizorul de identitate şi serviciul utilizat. 


Consimţământul 

Pentru utilizarea datelor cu caracter personal ale unei persoane, este nevoie de 
consimţământul informat şi explicit exprimat al acesteia referitor la cine, când, cum şi în 
ce scop se folosesc. Când trebuie partajate datele, aceste utilizări trebuie aduse la 
cunoştinţa persoanei. Ar trebui să fie întotdeauna posibilă retragerea consimţământului 


pentru viitoarele utilizări. 
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În analizele Big Data, se poate cunoaşte foarte puţin despre utilizările viitoare 
intenţionate ale datelor, şi despre beneficiile, şi riscurile implicate. Aici, există proceduri 
pentru consimţământul "larg" şi "generic" de a împărtăşi datele genomice, de ex., şi în 
scopuri diferite. Chiar şi atunci când se procedează corect, există anumite provocări 
practice specifice: obţinerea consimţământului în cunoştinţă de cauză poate fi imposibil 
sau foarte costisitor, iar valabilitatea consimţământului este disputabil când acordul este 


obligatoriu pentru a accesa un serviciu. 


Controlul 

În lumea actuală, datele personale pot fi tranzacţionate la fel ca orice monedă în 
implementarea Big Data. Există opinii diferite în ce măsură această situaţie este una etică, 
inclusiv cine să participe la profitul obţinut din aceste tranzacţionări.. 

În modelul de tranzacţionare a datelor cu caracter personal, transmiterea datelor 
personale este un cadru care oferă persoanelor posibilitatea de a-şi controla identitatea 
digitală şi a crea acorduri granulare de partajare a datelor. 

În prezent prinde contur ideea datelor deschise, centrată în jurul argumentului că 
datele ar trebui să fie disponibile în mod liber. Dorinţa de a partaja date variază în funcţie 
de persoană. 

În cazul copiilor, părinţii sau tutorii au responsabilitatea pentru datele lor, care nu 
pot fi tranzacţionate contra beneficii financiare. 

La nivel naţional, un guvern este suveran asupra datelor generate şi colectate. La 
26 octombrie 2001 a intrat în vigoare Actul Patriot în SUA, iar la 25 mai 2018, 
Regulamentul general privind protecţia datelor 2016/679 (GDPR) la nivelul Uniunii 


Europene, pentru problemele legate de protecţia datelor personale. 
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În Big Data, relaţia om-date este asimetrică, bazată pe controlul datelor. "Dreptul 
de a fi uitat”, adoptat la nivelul UE, este unul din elementele de bază ale controlului unui 


individ asupra datelor sale personale. 


Transparenţa 

Algoritmii utilizaţi în Big Data pot determina prejudecăţi care afectează sistematic 
drepturile individului. De aceea, proiectarea algoritmului ar trebui să fie transparentă şi 
inclusivă. 

Guvernarea anticipativă implică analize predictive pe baza Big Data pentru a 
evalua potenţiale comportamente, cu implicaţii etice care pot încuraja prejudecățile şi 
discriminarea. 

O persoană care acceptă includerea datelor sale personale în Big Data are dreptul 
să ştie de ce se colectează datele, cum vor fi folosite, cât timp vor fi stocate, şi cum pot fi 


modificate. 


Încrederea 

Încrederea în sistemele Big Data este legată de interdependenţe cu 
confidenţialitatea şi conştientizarea. Până în prezent, încrederea a fost considerată din 
perspectivă strict tehnologică. Se speră să se realizeze arhitecturi hardware şi software 
care ar putea creşte încredere între ființe umane şi obiecte, şi deci o mai mare acceptanţă 


a utilizării datelor personale. 


Proprietatea 
O întrebare fundamentală în etica cercetării cu Big Data este, cine deţine datele? 
Aceasta implică subiectul drepturilor şi obligaţiilor asupra proprietăţii. În legislaţia 


europeană, GDPR indică faptul că persoanele deţin propriile date cu caracter personal. 
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Suma datelor personale ale unui individ formează o identitate digitală. 

Protecţia drepturilor morale (dreptul de a fi identificat ca sursă a datelor, şi de a le 
controla) ale unui individ se bazează pe opinia că datele personale sunt o expresie directă 
a personalităţii acestuia, şi nu pot fi transferate unei alte persoane decât, eventual, prin 
succesiune atunci când individul moare. 

Proprietatea implică exclusivitate, respectiv restricționarea implicită a altora în 
ceea ce priveşte accesul la proprietate. O proprietate eficientă a datelor personale implică 
portabilitatea, posibilitatea de a folosi alternative fără a pierde din date. Standardizarea 
ar ajuta, de asemenea, la curăţare datelor personale. 

În mod efectiv, în prezent, datele sunt deţinute de proprietarul senzorilor, cel care 
efectuează înregistrarea sau entitatea care deţine senzorul. 

În UE, s-a restrâns în mod progresiv posibilitatea ca datele cetăţenilor UE să fie 
stocate în afara așa-numitului "Euro cloud", dar nu s-a rezolvat problema datelor deja 
stocate şi prelucrate în altă parte, şi "nu rezolvă dilema etică a modului în care 
proprietatea asupra datelor este definită în mod filosofic, înainte de a trece la o abordare 
mai degrabă a legii şi a elaborării politicilor.” (European Economic and Social Committee 


2017) 


Supravegherea şi securitatea 

Din ce în ce mai multe surse de date sunt disponibile cu ajutorul tehnologiilor 
avansate, precum circuitele CCTV, GPS, dispozitive mobile, carduri de credit, ATM. De 
asemenea, supravegherea activă este o metodă de colectare a datelor, dar în acelaşi timp 


de limitare a libertăţilor cetăţenilor. O astfel de supraveghere permanentă determină 
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creşterea stresului oamenilor, şi creează tendinţa acestora de a se comporta într-un 


anumit mod care să se conformeze normelor aşteptate. 


Identitatea digitală 

Identitatea digitală are avantajul accesului rapid la conţinutul online şi serviciile 
conexe. Utilizarea identităţii digitale are potenţialul de a genera discriminare bazată pe 
reprezentarea unei persoane conform datelor ei online, care de multe ori poate să nu 
corespundă cu situaţia reală, într-un proces numit "dictatura datelor” în care "nu mai 
suntem judecaţi pe baza acţiunilor noastre, ci pe baza a ceea ce indică toate datele despre 
noi ca fiind acţiunile noastre probabile", (Norwegian Data Protection Authority 2013) 


interacţiunea personală nefiind plasată într-un plan secundar. 


Realitatea ajustată 


Orice interacţiune a noastră cu Internetul implică posibilitatea stocării datelor 
noastre personale. Prelucrarea şi analiza acestor date determină rezultatele personalizate 
care ne apar ulterior pe Internet, prin rezultate ale căutărilor noastre, afişarea produselor 
în magazinele online, afișarea reclamelor, etc. Se generează astfel o versiune mai îngustă 
şi mai personalizată a experienţei online anterioare a unui utilizator (aşa-numitul "balon 
de filtrare" (Pariser 2011)). Un avantaj este că utilizatorul va găsi rapid ceea ce caută de 
obicei, dar excluderea anumitor aspecte, perspective şi idei poate duce la o restrângere a 
creativităţii şi dezvoltarea unei atitudini tolerante prin izolarea politică şi socială de 


celelalte aspecte, prin lipsa unor viziuni pluraliste. (Crawford, Gray, and Miltner 2014) 


De-anonimizarea 
De-identificarea implică ştergerea sau ascunderea elementelor care ar putea 
identifica imediat o persoană sau organizaţie. Legislaţia din diferite ţări privind protecţia 
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datelor defineşte tratamente diferite pentru datele identificabile. Identificabilitatea este 
văzută din ce în ce mai mult ca un continuum, nu un aspect binar. Riscurile de divulgare 
cresc simultan cu numărul de variabile, de surse de date şi cu puterea analizei datelor. 
Riscurile de dezvăluire pot fi atenuate, dar nu eliminate. De-identificarea rămâne un 
instrument vital pentru asigurarea utilizării în siguranţă a datelor. (UK Data Service 2017) 

Informaţii perfect anonime luate separat, pot fi combinate cu alte date pentru a 
identifica în mod unic o persoană cu grade diferite de certitudine. Profilarea poate deveni 
un instrument puternic, ridicând îngrijorări cu privire la gradul în care este permisă 


intruziunea în viaţa unui individ, posibilitatea asigurării securităţii, şi supravegherea. 


Inegalitatea digitală 

Avantajele dimensiunii mari a datelor sunt clare, dar există şi opinii conform 
cărora acumularea de date la o scară uriaşă prezintă riscuri specifice. Din această cauză, 
sunt puţine entităţi care au acces, prin infrastructură şi abilităţi, la sistemele Big Data. În 
acest context, costurile şi abilităţile necesare accesului duce la anumite inegalităţi digitale 


specifice abordate de etică. 


Confidenţialitatea 
În tranzacţiile de date este foarte important să se asigure confidenţialitatea: 
"Nimeni nu va fi supus la interferenţe arbitrare cu intimitatea, familia, casa sau 
corespondenţa sa şi nici la atacuri asupra onoarei şi reputației sale. Toată lumea 
are dreptul la protecţia legii împotriva unor asemenea ingerinţe sau atacuri. "- 
Declaraţia Organizaţiei Naţiunilor Unite privind Drepturile Omului, Articolul 12. 
În multe ţări, monitorizarea publică datelor de către guvern pentru a observa 
cetăţenii necesită o autorizare explicită printr-un proces judiciar adecvat. 


Confidenţialitatea nu este despre păstrarea secretelor, ci despre alegere, drepturile 


omului, şi libertate. 
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Adesea confidenţialitatea este văzută în mod greşit ca o alegere binară între izolare 
şi progres ştiinţific. Protejarea identităţii în date este posibilă tehnologic, de exemplu 
utilizând criptarea homomorfă şi designul algoritmic. 

Confidenţialitatea ca o limitare a utilizării datelor poate fi, de asemenea, 
considerată ne-etică, (Kostkova et al. 2016) în special în asistenţa medicală, dar trebui 
ţinut cont de faptul că este posibilă extragerea valorii datelor fără a compromite 
intimitatea. 

Confidenţialitatea este recunoscută ca un drept uman prin numeroase 
reglementări naţionale şi internaţionale. Confidenţialitatea în cercetare se realizează 
printr-o combinaţie de abordări: limitarea datelor colectate, anonimizarea acestora; şi 
reglementarea accesului la date. În cazul cercetării Big Data apar probleme specifice: 
ambiguitatea între termenii "privaţiune" şi "confidenţialitate; declararea spaţiilor sociale 
ca publice sau private; necunoaşterea riscurilor de confidenţialitate de către utilizatori; 
distincţia neclară între uzanţele publice şi private. În prezent există dispute dacă ştiinţa 
datelor ar trebui să fie clasificată ca o cercetare a subiecţilor umani, şi deci nesupusă 


normelor obişnuite de confidenţialitate. 


6. Cercetarea Big Data 
Prin noile concepte de "daune algoritmice”, "analize predictive”, etc., algoritmii 
folosiţi în prezent în operaţiunile Big Data depășesc viziunea tradiţională a 
confidenţialităţii. Conform Consiliului Naţional pentru Ştiinţă şi Tehnologie, 
”"Algoritmii analitici" sunt algoritmi pentru prioritizare, clasificare, filtrare şi predicţie. 
Utilizarea acestora poate crea probleme de confidenţialitate atunci când 
informaţiile utilizate de algoritmi sunt inadecvate sau inexacte, atunci când apar 


decizii incorecte, atunci când nu există mijloace rezonabile de recurs, atunci când 
autonomia unui individ este direct legată de rezultatul algoritmic sau atunci când 
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folosirea algoritmilor predictivi încurajează alte daune asupra vieţii private.” 
(NSTC (National Science and Technology Council) 2016, 18) 


Cercetările Big Data sunt ceea ce eticianul James Moor ar numi "harababura 
conceptuală" datorită "incapacității de a conceptualiza în mod corect valorile etice şi 
dilemele de joc într-un context tehnologic nou.” (Buchanan and Zimmer 2018) În această 
situaţie confidenţialitatea este asigurată printr-o combinaţie de diferite tactici şi practici 
(medii controlate sau anonime, limitarea informaţiilor personale, anonimizarea datelor, 
restricţii de acces, securizarea datelor, etc.). În general, toate noţiunile conexe devin 
confuze în cazul Big Data. Astfel, postările sociale sunt considerate publice în reţelele 
sociale în cazul unei setări corespunzătoare. Dar reţelele sociale sunt medii complexe de 
interacțiuni socio-tehnice unde utilizatorii nu înţeleg întotdeauna funcţionalitatea 
setărilor şi termenii de utilizare. Astfel, există o incertitudine în ceea ce priveşte intenţiile 
şi aşteptările utilizatorilor, iar aceste deficienţe conceptuale în contextul cercetărilor Big 


Data conduc la incertitudini în ceea ce priveşte necesitatea consimţământului informat. 


Concluzii 

Studiile de date critice în Big Data reflectă practicile, culturile, politica şi 
economiile specifice. (Dalton, Taylor, and Thatcher 2016) Problemele pot varia de la 
intimitatea şi autonomia indivizilor la etica ştiinţei datelor şi schimbările instituţionale 
datorate cercetărilor Big Data. Rezultă necesitatea de a analiza practicile Big Data 
conştiente de relaţiile de putere, prejudecăţi şi inegalităţi. 

O definiţie care ar restrânge cercetarea critică la domeniul teoriei normative şi 
critice ar fi contraproductivă. 

Principiile comune ale studiilor de date critice evidenţiază interdependenţele 


dintre tehnologiile emergente şi actorii (umani) din societăţile din ce în ce mai bine 
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prezentate. Big Data sunt şi un produs al condiţiilor socio-tehnice contemporane, 
deoarece sunt producătoare de astfel de condiţii. (Richterich, 2018) 

Domeniul studiilor de ştiinţă şi tehnologie (STS) are o relaţie destul de ambiguă cu 
evaluările normative ale tehnologiei. 

În STS, anumite componente sunt preocupate mai mult de abordările descriptive 
decât de cele normative. 

Spre deosebire de idealul STS comun al unui relativism "fără valoare", (Pels 1996, 
2777) Pels solicită recunoaşterea "poziţiilor a treia" în evaluările producţiei de cunoştinţe 
ştiinţifice care ” [... ] nu sunt exterioare domeniului de controversă studiat, ci sunt incluse 
şi implicate în acesta. [...] Ele nu sunt libere de valoare sau dispărute, ci sunt situate, 
parţial şi comise în sens politic şi de cunoaştere." (Pels 1996) 

O problemă majoră în Big Data este că nu se cunosc prea bine micro-procesele 
empirice care stau la baza apariţiei caracteristicilor lor tipice de reţea. (Snijders, Matzat, 
and Reips 2012) Big Data trebuie întotdeauna contextualizate în contextele sociale, 
economice şi politice ale acestora. (Graham 2012) 

Susţinătorii protejării vieţii private sunt îngrijoraţi de ameninţarea la adresa vieţii 
private datorită creşterii volumului de stocare şi integrare a informaţiilor de identificare 
personală. În acest sens, există diferite recomandări politice pentru a conforma practica 
şi viaţa privată. (Ohm 2012) Folosirea abuzivă a Big Data de mass-media, companii şi 
chiar guvern a dus la pierderea încrederii în instituţiile sociale. Pentru a proteja libertăţile 
individuale, Nayef Al-Rodhan consideră că este necesar un nou tip de contract social, cu 


monitorizarea şi reglementarea mai atentă a Big Data. (Al-Rodhan 2018) 
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Experimentele ştiinţifice au tendinţa de a analiza datele utilizând clustere 
specializate şi computere de înaltă performanţă, mai degrabă decât cloud, diferind astfel 
cultural şi tehnologic de restul societăţii. 

Utilizarea Big Data, datorită manipulării cantităților mari de date, a dus la 
neglijarea principiilor ştiinţei, precum alegerea  eşantioanelor reprezentative, 
determinând prejudecăţi în analiza rezultatelor. Această analiză este adesea superficială 
în comparaţie cu analiza seturilor mai mici de date. (Piatetsky 2014) Unele surse de date, 
precum Twitter, nu sunt reprezentative pentru populaţia totală. loannidis a susţinut că în 
folosirea Big Data, "cele mai multe rezultate publicate în cercetare sunt false" (Ioannidis 
2005) întrucât probabilitatea ca un rezultat “semnificativ” să fie fals creşte rapid cu 
volumul datelor, dar sunt publicate doar rezultatele pozitive. 

În utilizarea Big Data, UK Data Service evidenţiază mai multe probleme etice 
specifice: (UK Data Service 2017) 

e Au apărut alternative la consimţământul individual informat, de exemplu 
"consimţământul social", mult mai permisive. 

e A crescut necesitatea respectării sursei datelor şi, în general, "integritatea 
contextuală", în cazul reutilizării datelor. 

e Etica de cercetare se bazează în principal pe ideea că entitatea cercetată este o 
persoană individuală, deci ar fi posibilă de-identificarea pentru protejare. În cazul 
considerării unui grup ca un întreg, protecţia socială scade. În acest caz s-a propus 
ca datele să fie considerate ca "beneficii publice" sau de "interes public”, dar 
aceasta nu rezolvă responsabilitatea utilizatorii datelor. 

Matthew Zook et al. propune "zece reguli simple" etice în utilizarea Big, Data în 


cercetare. (Zook et al. 2017) Primele cinci reguli privesc modul de reducere a şanselor de 
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vătămare care rezultă din practicile de cercetare, iar celelalte reguli se referă la cele mai 


bune practici. 


1. 


Datele sunt oameni şi pot face rău: majoritatea datelor reprezintă sau 
influenţează oamenii. Începeţi cu presupunerea că datele sunt persoane (până 
când se dovedeşte altfel) şi ghidaţi-vă analiza pe această bază. 
Confidenţialitatea este mai mult decât o valoare binară: confidenţialitatea 
depinde de natura datelor, contextul în care au fost create şi obţinute, şi de 
aşteptările şi normele celor afectaţi. Ea se extinde la grupuri. Contextualizaţi datele 
pentru a anticipa încălcarea confidenţialităţii şi pentru a minimiza daunele. 
Evitaţi reidentificarea datelor dvs.: de multe ori nu se reuşeşte anonimizarea 
eficientă a datelor. Datele considerate a fi anonime sunt combinate cu alte variabile 
care pot duce la re-identificare. Identificaţi vectorii posibili de reidentificare şi 
minimizaţi-i în rezultatele publicate. 

Practicaţi schimbul de date etice: Pentru unele proiecte, precum în genetică, 
schimbul de date este o necesitate socială, dar rămân în continuare valabile 
consimţământul informat şi de dreptul de retragere. Partajaţi datele respectând 
protocoalele de cercetare, dar ţineţi cont de daunele potenţiale generate de datele 
colectate informal. 

Luaţi în considerare punctele tari şi limitele datelor dvs.; mai mare nu 
înseamnă automat mai bine: seturile de date trebuie fundamentate în 
contextul lor adecvat, ţinând cont inclusiv de conflictele de interese. În achiziţia 
datelor, este important să se înţeleagă sursa datelor, şi să se respecte 


reglementările. În medii cu reglementare slabă, pot fi folosite normele etice. 
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Cercetătorii trebuie să fie sensibili la semnificaţiile multiple potenţiale ale datelor. 
Documentaţi proveniența şi evoluţia datelor. 

Dezbateţi alegerile dure, etice: trebuie să se evite lipsa soluţiilor clare şi a 
protocoalelor. Astfel de dezbateri pot produce evaluări inter pares foarte utile. Se 
pot utiliza serviciile de consultare în domeniul eticii de cercetare din universități. 
Implicaţi-vă colegii şi studenţii în practica etică pentru o cercetare de mare 
amploare a Big Data. 

Flaboraţi un cod de conduită pentru organizaţia dvs., comunitatea de 
cercetare sau industria: "etica falsă”, ca şi falsificarea datelor sau rezultatelor, 
sunt inacceptabile. Este necesară elaborarea de coduri de conduită, care pot oferi 
îndrumări în evaluarea reciprocă a publicaţiilor şi în examinarea finanţării. 
Stabiliţi codurile adecvate de conduită etică, împreună cu reprezentanţii 
comunităţilor afectate. 

Proiectaţi-vă datele şi sistemele pentru audit: auditul furnizează un 
mecanism de verificare a muncii, sporind înţelegerea şi replicabilitatea. Planificaţi 
și iniţiaţi audituri ale practicilor Big Data. 

Implicaţi-vă cu consecinţe mai nari în practicile de date şi analiză: este 
important ca cercetătorii să gândească dincolo de valorile tradiţionale. Se poate 
cere furnizorilor stocarea în cloud, şi centrele de prelucrare a datelor pot să treacă 
la surse de energie durabile şi regenerabile. Realizarea unor cercetări de mare 
amploare are efecte la nivel de societate. 

Să ştiţi când să încălcaţi aceste reguli: trebuie să ştiţi la ce să vă aşteptaţi 


când vă îndepărtați de aceste reguli, precum în situaţii de dezastru natural sau de 
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urgenţă. Cercetarea responsabilă a Big Data depinde de mai multe liste de 

verificare. 

Indiferent de normele etice sau legale oamenii de ştiinţă trebuie să fie riguroşi în 
utilizarea tehnicilor şi metodologiilor, şi foarte precauţi în probleme de etică. Ideea că 
"datele sunt deja publice" (Zimmer 2016) sunt simplificări nejustificate. Datele nu sunt 
ceva abstract, ele sunt de fapt persoane reale. 

Cercetarea responsabilă a Big Data nu vizează restrângerea cercetării, ci asigurarea 
încrederii, corectitudinii şi maximizării aspectelor pozitive, reducând în același timp răul. 
Big Data oferă oportunităţi fantastice pentru a înţelege mai bine societatea şi lumea, dar 
trebuie să se ţină cont şi de responsabilitatea eticii în alegerile, practicile şi acţiunile 


cercetărilor. 
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